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Die VOLKSWAGEN Aktiengesellschaft in Wolfsburg/Deutschland hat eine 
Patentanmeldung unter der Bezeichnung 

"Verfahren und Einrichtung zum Betrieb von sprachunterstutzten 
Systemen in Kraftfahrzeugen" 

am 6. Mai 1998 beim Deutschen Patent- und Markenamt eingereicht. 

Die angehefteten Stucke sind eine richtige und genaue Wiedergabe der urspriingli- 
chen Unterlagen dieser Patentanmeldung. 

Die Anmeldung hat im Deutschen Patent- und Markenamt vorlaufig das Symbol 
G 10 L 7/08 der International Patentklassifikation erhalten. 
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Verfahren und Einrichtung zum Betrieb von sprachunterstiitzten Systemen 

in Kraftfahrzeugen 



Die Erfindung betrifft ein Verfahren sowie eine Einrichtung zum Betrieb von sprach- 
unterstiitzten Systemen, wie Kommunikations- und/oder Sprech- /Gegensprech- 
.einrichtungen in Kraftfahrzeugen, bei welchem bzw. bei welcher uber eine 
A/lehrfachmikrofonanordnung Sprachsignale aufgenommen und an mindestens einen 
Lautsprecher weitergegeben werden, gemaB Oberbegriff der Patentanspriiche 1 und 7 . 



Verfahren dieser Art werden in Kraftfahrzeugen zum einen zum sprachunterstiitzten 
Gegensprechbetrieb eingesetzt, Oder aber auch zur Unterstiitzung von sprachein- 
gabegesteuerten elektronischen Oder elektrischen Baugruppen. Die grundsatzliche 
Problematik hierbei ist, daB im Kraftfahrzeug je nach Betriebszustand eine entsprechende 
Gerauschkulisse vorhanden ist. Diese uberdeckt die Sprachbefehle. Sprech- und 
Gegensprechanlagen in Kraftfahrzeugen sind iiberwiegend bei groBen Fahrzeugen, 
Minibussen und dergleichen vorteilhaft. Sie konnen jedoch auch bei normalen 
Personenkraftwagen eingesetzt werden. Bei der Verwendung von sprachgesteuerten 
-ingabeeinheiten fur elektrische Komponenten im Fahrzeug ist die Unterdriickung der 
erauschkulisse bzw. das Herausfiltern des Sprachbefehles noch von besonderer 
Bedeutung. 



So ist aus der EP 0078014 B 1 eine Spracherkennungseinrichtung fur ein Kraftfahrzeug 
bekannt, bei welchem in das Verstarkersystem der Spracherkennungseinrichtung uber 
Sensoren gemeldet bzw. eingespeist wird, ob der Motor in Betrieb ist und/oder sich das 
Fahrzeug bewegt. Danach richtet sich sodann eine Pegalbeeinflussung mit der versucht 
wird, den Sprachbefehl aus der Gerauschkulisse herauszufiltem. 

Aus der DE 3742929 C 1 ist eine Anordnung mit zwei Mikrofonen bekannt, wobei eines der 
Mikrofone am Mund der Bedienperson angeordnet ist und ein anderes in der Nahe, jedoch 



zur Aufnahme des Korperschalles. Beide Mikrofonsignale werden getriggert derart, daB 
Korperschatl vom Gesamtschall subtrahierbar ist. 

Aus der DE 19705471 A 1 ist bekannt, eine Spracherkennung mit Hilfe einer Trans- 
versalfilterung zu unterstutzen. Hierbei wird eine Frequenzanalyse vorgenommen, die 
jedoch lediglich zu dem Zweck der Sprachbefehlserkennung dient. Es findet hierbei keine 
Nebengerauschkompensation statt. 

Aus der WO 97/34290 ist eine Filterung bekannt, bei der periodische Storsignale 
ausgefiltert werden, in dem deren Periode ermittelt und mittels Generator herausinterferiert 
wird, so daft das Sprachsignal iibrig bleibt. 

^us der DE 4106405C 2 ist ein Verfahren bekannt, bei dem eine Gerauschsubtraktion vom 
Sprachsignal erfolgt, wobei eine Mehrzahl von Mikrofonen verwendet wird. 

Aus der DE 3925589 A 1 ist die Verwendung einer Mehrfachmikrofonanordnung bekannt. 
wobei bei Anwendung im Kraftfahrzeug eines der Mikrofone im Motorraum und ein weiteres 
im Fahrgastraum angeordnet ist. Sodann erfolgt eine Subtraktion beider Signale. Nachteilig 
ist hierbei, daS lediglich das Motorgerausch bzw. das eigentliche Betriebsgerausch des 
Fahrzeuges selbst vom Gesamtsignal im Fahrgastraum abgezogen wird. Spezifische 
Nebengerausche werden hierbei unberticksichtigt gelassen. Ebenso fehlt eine 
Ruckkopplungsunterdruckung, die eine besondere Problematik darstellt. Oberall dort, wo 
Mikrofone und Lautsprecher in akustisch ankoppelbarer Nahe angeordnet sind. kommt es 

Ivor, daft das am Lautsprecher ausgekoppelte akustische Signal wiederum in das Mikrofon 
Jpckeinspeist. Es kommt zu einer sogenannten Riickkopplung und einer darauf folgenden 
Ubersteuerung. 

Der Erfindung liegt somit die Aufgabe zugrunde, ein Verfahren sowie eine Einrichtung der 
gattungsgemaften Art dahingehend weiterzubilden, daB Riickkopplungen und Instabilitaten 
die bei Anordnung mehrerer Mikrofone und Lautsprecher auftreten zu unterdrticken. 

Die gestellte Aufgabe ist bei einem Verfahren der gattungsgemaBen Art erfindungsgemaB 
durch die kennzeichnenden Merkmale des Patentanspruches 1 gelost. 



Weitere vorteilhafte Ausgestaltungen des Verfahrens sind in den Ansprtichen 2 bis 5 
angegeben. 




Hinsichtlich einer Einrichtung der gattungsgemaBen Art ist die gestellte Aufgabe 
erfindungsgemaB durch die kennzeichnenden Merkmale des Patentanspruches 6 gelost. 
Weitere vorteilhafte Ausgestaltungen der einrichtungsgemafien Erfindung sind in den 
ubrigen Ansprtichen angegeben. 

Die Erfindung geht sowohl hinsichtlich des Verfahrens als auch der Einrichtung von einer 
Kommunikations- und/oder Sprech- /Gegensprecheinrichtung in Kraftfahrzeugen aus. Es ist 
auch bekannt, hierbei eine Mehrfachmikrofonanordnung anzuordnen, dartiber hinaus 
Sprach- als auch Gerauschsignale aufzunehmen und vom Gesamtsignal die 
Gerauschsignale wiederum zu subtrahieren, so daS das Sprachsignal gefiltert ubrig bleibt. 

Gem§B der gestellten Aufgabe besteht der Kem der Erfindung darin, daS das jeweilige 
Mikrofonsignal zunachst um einen kleinen Betrag A F frequenzverschoben wird, und 
nachfolgend erst auf den oder die Lautsprecher Oder auf die Eingabe einer sprach- 
gesteuerten Einrichtung gegeben wird. Die erfindungsgemaSe Frequenzverschiebung, die 
hierbei an definierter Stelle vorgenommen wird und nicht wiilkurlich ist, unterstutzt zum 
einen die Filterung und zum anderen werden Ruckkoppelungen, also auch das Echosignal 
ausgekoppelt. 

Da Ruckkopplungen ohne die besagte erfindungsgemaSe Frequenzverschiebung nichts 
weiter sind als das riickgekoppelt verstarkte Sprachsignal, konnen mit Mitteln und 
Vorgehensweisen aus dem zitierten Stand der Technik solche Ruckkopplungen nicht 
eiiminiert werden. Dies aus dem besagten Grund, weil Einrichtungen der bekannten Art 
Jediglich das Sprachsignal vom Gerauschsignal separieren und das riickgekoppelte Signal 
als Sprachsignal und nicht als Gerauschsignal identifizieren. Dadurch sind die besagten 
Ruckkopplungen mit Hilfe der im Stand der Technik bekannten Mittel nicht, oder nicht 
gleichzeitig beherrschbar. 



Demgegeniiber wird jedoch durch das erfindungsgemaBe Verfahren sowie durch 
erfindungsgemaBe Einrichtung, die sich auf die Verschaltung der einzelnen Elemente 
miteinander bezieht werden auf elegante Weise Riickkopplungseffekte eiiminiert. 

Da die Ruckkopplung als solches ursachlich immer dann auftritt, wenn Mikrofonort und 
Lautsprecherort dicht beieinander liegen, was in Kraftfahrzeugen zwanghaft der Fall ist, 
kommt der Eliminierung dieser Ruckkopplung im genannten Anwendungsfall ganz 
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erhebliche Bedeutung zu. Dies gilt nicht nur im Falle des Gegensprechbetriebes, bei dem 
elektroakustische Riickkopplungen fur die Insassen unangenehm sind, sondern besondere 
Bedeutung kommt auch beim Einsatz sprachgesteuerter Eingabeschnittstelien von 
elektrischen bzw. elektronischen Bauteilen am Kraftfahrzeug zu. Dies gilt nur dann, wenn 
die gesamte Anordnung im Fahrzeug sowohl Mikrofone als auch Lautsprecher umfaSt, und 
hieriiber auch die sprachgesteuerte Eingabe an elektrische Gerate erfolgt. Riickkopplungen 
und daraus resultierende Gbersteuerungen konnen selbst bei intelligenten 
Eingabeschnittstelien erhebliche Fehlfunktionen und MiRdeutungen des Sprachbefehles 
hervorrufen. Je nach Einsatzfall stellt dies auch ein Sicherheitsrisiko dar. Wahlweise kann 
die gleichzeitige Gerauscheliminierung zusatzlich, d.h. gleichzeitig vorgenommen werden. 

^^^Die Erfindung ist in der Zeichnung dargestellt und nachfolgend naher beschrieben. 

Die Abbildung zeigt den prinzipiellen Aufbau sowie auch die Funktionsweise, so dafi aus 
der Abbildung selbst sowohl die VerfahrensmaBnahmen, als auch die Verschaltung der 
einzelnen einrichtungsgemSften Elemente zueinander in ihrer logischen Gesamtheit 
erkennbar ist, bzw. sind. 



In diesem dargestellten Ausfiihrungsbeispiel der Erfindung ist der Fahrzeuginnenraum in 
zwei Teilraume unterteilt, namlich vorne und hinten. 

Im vorderen Teil befindet sich ein Mikrofon M 1 und ein Lautsprecher L 2 . 
Das Mikrofon M 1 nimmt das dortige Sprachsignal und ggf. Gerauschsignale auf. Das 
Gerauschsignal besteht dabei aus der sich im Betrieb des Fahrzeuges ergebenden 
IperSuschkulisse im Fahrgastraum. Dies konnen Motorengerausche, Windgerausche sowie 
AbrollgerSusche aber auch akustische Echosignale aus dem anderen Teilraum und 
dergleichen mehr sein. Das an M 1 enthaltene Summensignal aus Sprache- und 
Gerauschkulisse wird einem ersten Summationspunkt S 1 zugefuhrt. Diesem 
Summationspunkt wird dann ebenfalls ein entsprechend aufbereitetes Signal aus einem 
akustischen Model AM 1 vome, zugefuhrt. Das im akustischen Modell AM 1 generierte 
Subtraktionssignal entstammt in diesem Ausfuhrungsbeispiel aus dem im hinteren Teil des 
Fahrzeuges erhaltenen, und bereits frequenzverschobenen Signal. Dadurch, daft dieses 
von M 2 kommende und in F 2 frequenzverschobene Signal, welches dem hinteren 
Teilraum der Fahrgastzelle entstammt, iiber AM 1 signaltechnisch auch vorne berticksichtigt 
wird, wird die im hinteren Teil des Fahrzeuges generierte und nach vorne, in den vorderen 
Teil der Fahrgastzelle akustisch transportierte Teil, welcher auch von M 1 registriert wird, 
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am Summationspunkt S 1 wiederum subtrahiert. D.h., durch die Einrichtung AM 1 wird der 
hintere Teilraum der Fahrgastzelle vom vorderen Teilraum der Fahrgastzelle akustisch 
getrennt. D.h., zunachst wird in M 1 das gesamt wahrnehmbare akustische Signal 
eingespeist, und am Summationspunkt S 1 zunachst das Echo vom hinteren Teilraum der 
Fahrgastzelle subtrahiert. Das so erhaltene originate Signal von M 1 aus dem vorderen 
Teilraum der Fahrgastzelle wird sodann einer Frequenzverschiebeeinrichtung F 1 zugefuhrt 
und urn einen Betrag A F, beispielsweise 5 Hz, verschoben. Das so erhaltene 
Ausgangssignal von M 1 wird sodann dem Lautsprecher L1 des hinteren Teilraumes der 
Fahrgastzelle zugefuhrt und zum anderen gleichzeitig auch wiederum auf die gleiche Weise 
in die Einrichtung AM 2 eingespeist. AM 2 reprasentiert dabei wieder das akustische Modell 
fur den hinteren Teilraum der Fahrgastzelle. Die Gbermittlung einer Sprachnachricht vom 
hinteren Teilraum der Fahrgastzelle uber M 2 zum vorderen Teilraum der Fahrgastzelle 
iber L 2 erfolgt in analoger Weise. D.h., das Mikrofon M 2 registriert die Sprachnachricht 
samt Gerauschkulisse im hinteren Teilraum der Fahrgastzelle und ubermittelt sie an den 
Summationspunkt S 2 , an welchem das uber M 1 aufgenommene akustische 
Gesamtsignal, d.h., das Echo sowie Nebengerausche, subtrahiert wird. Das so wiederum 
erstellte echofreie Signal von dem Mikrofon M 2 wird sodann ebenfalls einer 
Frequenzverschiebeeinrichtung F 2 zugefuhrt, die wiederum eine Frequenzverschiebung 
urn einen Betrag A F vornimmt. Am Ausgang dieser Frequenzverschiebungseinrichtung F 2 
wird das Ergebnis bzw. das so aufbereitete Signal wiederum dem vorderen Teilraum der 
Fahrgastzelle, namlich dem dort positionierten Lautsprecher L 2 zugefuhrt. Die 
Frequenzverschiebung fur die Gbermittlung von vorne nach hinten kann auch vor 
derjenigen Frequenzverschiebung von hinten nach vome unterschieden sein. 

isgesamt ergibt sich ein geschlossenes rtickkopplungsfreies System. Dabei ist die 
Verschiebung der Frequenz ein wesentliches Merkmal, und durch das Zusammenwirken mit 
der Verschaltung uber die akustischen Modelle AM 1 und AM 2 ist eine Echoeliminierung 
vom vorderen zum hinteren Teilraum und umgekehrt gegeben. 

Es ist jedoch auch moglich, daft zusatzlich zur Echounterdriickung und 
Ruckkopplungseliminierung auch eine Gerauschsignalsubtraktion hinzukommt. Dies kann in 
geeigneter Weise im jeweiligen akustischen Modell AM1 und AM 2 mitberucksichtigt 
werden. Die weitergehenden, hierzu notwendigen Komponenten, wie 
Gerauschsignalmikrofone, sind dabei nicht weiter dargestellt. 



Somit la&t sich also sagen, daS jedes akustische Eingabesignal von M 1 sowie auch von M 
2, bevor es weitergehend aufbereitet und den Lautsprechem L 2 bzw. L 1 zugefuhrt wird, 
das aus Echo und ubrigen Gerauschen zusammengesetzte Gesamtgerauschkulissensignal 
subtrahiert wird. Es findet somit nicht nur eine akustische Abkopplung zwischen vorderem 
und hinterem Teilraum der Fahrgastzelle statt, sondem auch die ubrigen Gerauschsignale 
werden quasi in ein und demselben Aktionsschritt mitkompensiert bzw. subtrahiert. 
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Verfahren zum Betrieb von sprachunterstiitzten Systemen, wie Kommunikations- 
und/oder Gegensprecheinrichtungen in Kraftfahrzeugen, bei welchem uber eine 
Mehrfachmikrofonanordnung Sprachsignale aufgenommen und an mindestens einen 
Lautsprecher weitergegeben werden, 
dadurch gekennzeichnet, 

daS das Sprachsignal bzw. das Sprachsignalspektrum zunachst urn einen Betrag A F 
frequenzverschoben wird und nachfolgend erst auf den Oder die Lautsprecher Oder auf 
die Eingabe einer sprachgesteuerten Einrichtung gegeben wird. 

2. Verfahren zum Betrieb von sprachunterstiitzten Systemen, nach Anspruch 1, 
dadurch gekennzeichnet, 

daS jeweils vor Ubermittlung des Signales an die Lautsprecher das Echo aus dem 
lautsprecherbezogenen Umfeld vom Signal des hierfur betatigten mikrofonbezogenen 
Umfeldes subtrahiert wird. 

Verfahren zum Betrieb von sprachunterstiitzten Systemen, nach Anspruch 1 Oder 2, 
dadurch gekennzeichnet, 

daB bei Verwendung einer Mehrzahl von Mikrofonen jedes akustische Aufnahmesignal 
eines jeden Mikrofones nach Subtraktion des jeweils lautsprecherbezogenen Umfeldes 
bzw. des dort generierten Gerauschsignales, urn A F frequenzverschoben wird. 

Verfahren zum Betrieb von sprachunterstiitzten Systemen, nach einem Oder mehreren 
der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

daB zur akustischen Ankopplung bzw. Subtraktion der Gesamtgerauschkulissensignale 
ein beiiebiges akustisches Modell aus den aufgenommenen Gesamtsignalen gebildet 
wird und signaltechnisch zwischen jeweiligem Mikrofon und jeweiliger 




Frequenzverschiebung auf einen jeweiligen Summationspunkt zur Subtraktion 
aufgegeben wird. 

5. Verfahren zurn Betrieb von sprachunterstutzten Systemen nach Anspruch 4, 
dadurch gekennzeichnet, 

daB der Fahrgastraum des Fahrzeuges in mindestens zwei akustisch Teilraume 
aufgeteilt ist, derart, daB in jedem Teilraum zumindestens ein Mikrofonort als auch 
mindestens ein Lautsprecherort vorhanden ist, daB zwischen Mikrofonort des einen 
Teilraumes und dem Lautsprecherort des anderen Teilraumes die besagte 
Frequenzverschiebung Delte F erfolgt und zwischen den Lautsprecherorten und 
Mikrofonorten des einen Teilraumes und zwischen den Lautsprecherorten und 
Mikrofonorten des anderen Teiltraumes die besagten akustischen Modelle angewendet 
werden, so daB signaltechnisch ein geschlossener elektroakustischer Regelkreis 
entsteht. 



6. Verfahren zurn Betrieb von sprachunterstutzten Systemen nach einem Oder mehreren 
der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

daB uber die besagten akustischen Modelle nicht nur die Sprach- und/oder 
Gerauschsignale der unterschiedlichen Teilraume in der Fahrgastzelle berucksichtigt 
werden, sondem zusatzlich ermittelte im gesamten Umfeld bestehende Gerausche 
mitberticksichtigt und vom Gesamtschallsignal subtrahiert werden, so daB im 
wesentlichen das Sprachsignal ubrig bleibt. 

|7. Einrichtung zurn Betrieb von sprachunterstutzten Systemen, wie Kommunikations- 
und/oder Gegensprecheinrichtungen in Kraftfahrzeugen, mit einer Mehrzahl von 
Mikrofonen und Lautsprechem, sowie mit Mitteln zur Obertragung von 
Sprachnachrichten Oder Sprachbefehlen 
dadurch gekennzeichnet, 

daB der Fahrgastraum im Kraftfahrzeug in mindestens zwei ggf. offene Teilbereiche 
(vorne, hinten) mit jeweils mindestens einem Mikrofon (M1, M2) und mindestens einem 
Lautsprecher (L1, L2) unterteilt ist, daB die besagten Mittel auch 
Frequenzverschiebeeinrichtungen (F1, F2) umfassen, welche zwischen jeweils einem 
der Mikrofone (M1, M2) und dem im jeweils anderen Teilbereich (vome, hinten) 
befindlichen Lautsprecher geschaltet ist, und daB das jeweils resultierende 
Lautsprechersignal parallel abgreifbar und dem jeweils im selben Teilbereich 




angeordneten Mikrofonsignal uber Summationspunkte (S1, S2) subtraktiv uberlagerbar 
ist. 

8. Einrichtung zum Betrieb von sprachunterstutzten Systemen nach Anspruch 7, 
dadurch gekennzeichnet, 

daS zwischen Parallelabgriff des jeweiligen Lautsprechersignales und dem jeweiligen 
Summationspunkt (S1, S2) Mittel (AM1, AM2) vorgesehen sind, uber welche 
sogenannte akustische Modelle generierbar sind, die das jeweilige Lautsprechersignal 
beeinflussen/nachbearbeiten und das Ergebnissignal aus (AM1) und (AM2) auf den 
jeweiligen Summationspunkt schaltbar ist. 

9. Einrichtung zum Betrieb von sprachunterstutzten Systemen nach Anspruch 8, 
dadurch gekennzeichnet, 

dafi die akustischen Modelle (AM1, AM2) Mittel zur Gerauschmustererkennung 
enthalten, die zur Separierung von Motor-/Fahrgerauschen von sprachgenerierten 
akustischen Signalen, sowie zur Separierung primar sprachgenerierter Signale von 
rtickgekoppelten Echosignalen dienen. 



# 
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ZUSAMMENFASSUNG 



Verfahren und Einrichtung zum Betrieb von sprachunterstiitzten Systemen in 



kDie Erfindung betrifft ein Verfahren sowie eine Einrichtung zum Betrieb von sprach- 
■unterstutzten Systemen, wie Kommunikations- und/oder Sprech/Gegensprechein- 
richtungen in Kraftfahrzeugen, bei welchem bei einer Mehrfachmikrofonanordnung 
Sprachsignale aufgenommen und an mindestens einen Lautsprecher weitergegeben wird. 
Urn bei einem Verfahren sowie einer Einrichtung dieser Art zu gewahrieisten, daR 
Riickkopplungen eliminiert werden, ist erfindungsgemaS vorgeschlagen, daS das 
Sprachsignal bzw. das Sprachsignalspektrum zunachst urn einen kleinen Betrag A F 
frequenzverschoben wird und nachfolgend erst auf den Oder die Lautsprecher Oder auf die 
Eingabe einer sprachgesteuerten Einrichtung gegeben wird. 



Kraftfahrzeugen 




(Fig) 
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